DAY24 Single Layer Perceptron24/30

2024 iThome 鐵人賽

DAY 24

AI/ ML & Data

機器學習與深度學習背後框架與過程論文與實作系列第 23 篇

16th鐵人賽

2024-08-31 23:04:37

370 瀏覽

分享至

單層感知器 (Single Layer Perceptron) 的概念

單層感知器是一種最簡單的神經網絡模型，用於解決線性可分的二元分類問題。感知器模型由一個輸入層和一個輸出層組成，其中輸出層只有一個神經元。感知器的目標是學習一個線性決策邊界來區分兩類數據。

輸入層：由若干個輸入特徵組成。
權重 (Weights)：每個輸入特徵都有一個對應的權重 ( w )。
偏置 (Bias)：在計算過程中添加一個額外的常數項 ( b ) 來調整模型。
激活函數 (Activation Function)：感知器使用階躍函數（Step Function）作為激活函數，這是一種二值化的非線性函數。

加權求和：對所有輸入特徵進行加權求和，再加上偏置項。
[
激活函數：將加權求和的結果輸入到激活函數中。對於二元分類問題，通常使用階躍函數來決定輸出是 1 還是 0。
更新權重：如果預測結果與實際結果不符，則根據預測錯誤來調整權重和偏置。

3. 限制

單層感知器只能解決線性可分的問題。如果數據集不是線性可分的，感知器將無法找到一個合適的決策邊界。

import numpy as np

class Perceptron:
    def __init__(self, learning_rate=0.01, n_iters=1000):
        self.learning_rate = learning_rate
        self.n_iters = n_iters
        self.weights = None
        self.bias = None
    
    def fit(self, X, y):
        n_samples, n_features = X.shape
        self.weights = np.zeros(n_features)
        self.bias = 0

        for _ in range(self.n_iters):
            for idx, x_i in enumerate(X):
                linear_output = np.dot(x_i, self.weights) + self.bias
                y_predicted = self._activation(linear_output)
                
                update = self.learning_rate * (y[idx] - y_predicted)
                self.weights += update * x_i
                self.bias += update
    
    def predict(self, X):
        linear_output = np.dot(X, self.weights) + self.bias
        y_predicted = self._activation(linear_output)
        return y_predicted
    
    def _activation(self, x):
        return np.where(x >= 0, 1, 0)


X = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
y = np.array([0, 0, 0, 1])  # AND 閘

# 初始化並訓練感知器
perceptron = Perceptron(learning_rate=0.1, n_iters=10)
perceptron.fit(X, y)

# 預測
predictions = perceptron.predict(X)
print("預測結果:", predictions)

數據集：在這個範例中，我們使用了一個簡單的二元分類數據集來模擬 AND 邏輯閘。數據集包括四個二進制輸入組合（[0, 0], [0, 1], [1, 0], [1, 1]），其標籤分別為 0 和 1。
模型訓練：我們定義了一個感知器類，並在 fit 方法中實現了權重和偏置的更新過程。模型通過多次迭代來學習適合的權重和偏置，使其能夠正確分類輸入。
預測：使用訓練後的感知器模型對原始輸入進行預測，結果顯示感知器成功學習到了 AND 邏輯。

單層感知器是理解神經網絡的基石，它展示了如何利用線性組合和激活函數來進行二元分類。在更複雜的神經網絡中，多層感知器（MLP）通過引入多個隱藏層，能夠處理非線性問題，這些隱藏層中的每個神經元都可以被視為一個感知器。因此，理解單層感知器的工作原理是掌握更高階神經網絡的關鍵。